智能论文笔记

UnProjection: Leveraging Inverse-Projections for Visual Analytics of High-Dimensional Data

Mateus Espadoto , Gabriel Appleby , Ashley Suh , Dylan Cashman , Mingwei Li , Carlos Scheidegger , Erik W Anderson , Remco Chang , Alexandru C Telea

分类：机器学习

2021-11-02

投影技术经常用于可视化高维数据，使用户能够更好地理解在2D屏幕上的多维空间的总体结构。尽管存在着许多这样的方法，相当小的工作已经逆投影的普及方法来完成 - 绘制投影点，或者更一般的过程中，投影空间回到原来的高维空间。在本文中我们提出NNInv，用近似的任何突起或映射的逆的能力的深学习技术。 NNInv学会重建上的二维投影空间从任意点高维数据，给用户在视觉分析系统所学习的高维表示的能力进行交互。我们提供NNInv的参数空间的分析，并在选择这些参数提供指导。我们通过一系列定量和定性分析的延长NNInv的有效性验证。交互式实例中插值，分级协议，梯度可视化：然后，我们把它应用到三个可视化任务，验证了该方法的效用。

translated by 谷歌翻译

A Topic Modeling Approach to Classifying Open Street Map Health Clinics and Schools in Sub-Saharan Africa

Joshua W. Anderson , Luis Iñaki Alberro Encina , Tina George Karippacheril , Jonathan Hersh , Cadence Stringer

分类：机器学习

2022-12-22

Data deprivation, or the lack of easily available and actionable information on the well-being of individuals, is a significant challenge for the developing world and an impediment to the design and operationalization of policies intended to alleviate poverty. In this paper we explore the suitability of data derived from OpenStreetMap to proxy for the location of two crucial public services: schools and health clinics. Thanks to the efforts of thousands of digital humanitarians, online mapping repositories such as OpenStreetMap contain millions of records on buildings and other structures, delineating both their location and often their use. Unfortunately much of this data is locked in complex, unstructured text rendering it seemingly unsuitable for classifying schools or clinics. We apply a scalable, unsupervised learning method to unlabeled OpenStreetMap building data to extract the location of schools and health clinics in ten countries in Africa. We find the topic modeling approach greatly improves performance versus reliance on structured keys alone. We validate our results by comparing schools and clinics identified by our OSM method versus those identified by the WHO, and describe OSM coverage gaps more broadly.

translated by 谷歌翻译

Synthetic Image Data for Deep Learning

Jason W. Anderson , Marcin Ziolkowski , Ken Kennedy , Amy W. Apon

分类：计算机视觉 | 机器学习

2022-12-12

Realistic synthetic image data rendered from 3D models can be used to augment image sets and train image classification semantic segmentation models. In this work, we explore how high quality physically-based rendering and domain randomization can efficiently create a large synthetic dataset based on production 3D CAD models of a real vehicle. We use this dataset to quantify the effectiveness of synthetic augmentation using U-net and Double-U-net models. We found that, for this domain, synthetic images were an effective technique for augmenting limited sets of real training data. We observed that models trained on purely synthetic images had a very low mean prediction IoU on real validation images. We also observed that adding even very small amounts of real images to a synthetic dataset greatly improved accuracy, and that models trained on datasets augmented with synthetic images were more accurate than those trained on real images alone. Finally, we found that in use cases that benefit from incremental training or model specialization, pretraining a base model on synthetic images provided a sizeable reduction in the training cost of transfer learning, allowing up to 90\% of the model training to be front-loaded.

translated by 谷歌翻译

Continual learning benefits from multiple sleep mechanisms: NREM, REM, and Synaptic Downscaling

Brian S. Robinson , Clare W. Lau , Alexander New , Shane M. Nichols , Erik C. Johnson , Michael Wolmetz , William G. Coon

分类：神经与进化计算 | 机器学习

2022-09-09

在不失去先前学习的情况下学习新任务和技能（即灾难性遗忘）是人为和生物神经网络的计算挑战，但是人工系统努力与其生物学类似物达成平等。哺乳动物的大脑采用众多神经手术来支持睡眠期间的持续学习。这些是人工适应的成熟。在这里，我们研究了建模哺乳动物睡眠的三个不同组成部分如何影响人工神经网络中的持续学习：（1）在非比型眼运动（NREM）睡眠期间观察到的垂直记忆重播过程；（2）链接到REM睡眠的生成记忆重播过程；（3）已提出的突触降压过程，以调整信噪比和支持神经保养。在评估持续学习CIFAR-100图像分类基准上的性能时，我们发现将所有三个睡眠组件的包含在内。在以后的任务期间，训练和灾难性遗忘在训练过程中提高了最高准确性。尽管某些灾难性遗忘在网络培训过程中持续存在，但更高水平的突触缩减水平会导致更好地保留早期任务，并进一步促进随后培训期间早期任务准确性的恢复。一个关键的要点是，在考虑使用突触缩小范围的水平时，手头有一个权衡 - 更具侵略性的缩减更好地保护早期任务，但较少的缩减可以增强学习新任务的能力。中级水平可以在训练过程中与最高的总体精度达到平衡。总体而言，我们的结果都提供了有关如何适应睡眠组件以增强人工连续学习系统的洞察力，并突出了未来神经科学睡眠研究的领域，以进一步进一步进行此类系统。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Towards a General Purpose CNN for Long Range Dependencies in $\mathrm{N}$D

David W. Romero , David M. Knigge , Albert Gu , Erik J. Bekkers , Efstratios Gavves , Jakub M. Tomczak , Mark Hoogendoorn

分类：机器学习 | 计算机视觉

2022-06-07

由于一系列理想的模型属性，卷积神经网络（CNN）的使用在深度学习中被广泛扩展，这导致了有效有效的机器学习框架。但是，必须将CNN架构定制为特定任务，以结合输入长度，分辨率和尺寸的考虑因素。在这项工作中，我们通过连续的卷积神经网络（CCNN）克服了针对特定问题的CNN体系结构的需求：一个配备了连续卷积内核的单个CNN体系结构，可用于根据任意分辨率，维度，长度和长度的数据进行任务，而无需结构性长度变化。连续的卷积内核在每一层的远距离依赖性模型，并消除当前CNN体系结构中所需的降采样层和任务依赖性深度的需求。我们通过将相同的CCNN应用于顺序（1 $ \ mathrm {d} $）和视觉数据（2 $ \ mathrm {d} $）上的一系列任务来显示我们方法的普遍性。我们的CCNN竞争性能，并且在所有考虑的所有任务中通常都优于当前最新的。

translated by 谷歌翻译

Introducing the ICBe Dataset: Very High Recall and Precision Event Extraction from Narratives about International Crises

Rex W. Douglass , Thomas Leo Scherer , J. Andrés Gannon , Erik Gartzke , Jon Lindsay , Shannon Carcelli , Jonathan Wilkenfeld , David M. Quinn , Catherine Aiken , Jose Miguel Cabezas Navarro

分类：自然语言处理

2022-02-14

国际危机如何展开？我们将国际关系概念化为对手之间的战略国际象棋游戏，并开发了一种系统的方法，以准确且一致的历史准确，一致地测量碎片，移动和gam。我们基于国际危机行为（ICB）项目的非常高质量的叙事语料库，介绍了一个名为ICBE的国际事件的新本体和数据集。我们证明，ICBE的覆盖范围，召回和精度比现有数据集的现有状态更高，并进行了两项关于古巴导弹危机（1962）和Crimea-Donbas危机（2014）的详细案例研究。我们进一步介绍了两个新的事件可视化（事件Icongraphy和危机地图），这是一种使用自然语言处理（Sythnetic叙述）测量事件召回的自动基准，以及用于客观测量事件精确度的本体论重建任务。我们在伴侣网站www.crisisevents.org和github存储库中提供数据，在线附录，复制材料以及可视化的可视化材料和可视化。

translated by 谷歌翻译

Machine Learning: Algorithms, Models, and Applications

Jaydip Sen , Sidra Mehtab , Rajdeep Sen , Abhishek Dutta , Pooja Kherwa , Saheel Ahmed , Pranay Berry , Sahil Khurana , Sonali Singh , David W. W Cadotte

分类：机器学习 | 人工智能

2022-01-06

近期目睹了机器学习算法系统的快速发展，尤其是加强学习，自然语言处理，计算机和机器人视觉，图像处理，语音和情感处理和理解。凭借机器学习模型，算法及其应用的越来越重要和相关性，并且随着更多创新使用的深度学习和人工智能的情况，目前的体积呈现出一些创新研究工作及其在现实世界中的应用，如股票交易，医疗和医疗保健系统和软件自动化。本书中的章节说明了如何设计，优化和部署机器学习和深度学习算法和模型。该体积对于高级毕业生和博士生，研究人员，大学教师，练习数据科学家和数据工程师，专业人士和顾问以及在机器学习，深度学习和人工智能的广泛领域。

translated by 谷歌翻译

Learning from learning machines: a new generation of AI technology to meet the needs of science

Luca Pion-Tonachini , Kristofer Bouchard , Hector Garcia Martin , Sean Peisert , W. Bradley Holtz , Anil Aswani , Dipankar Dwivedi , Haruko Wainwright , Ghanshyam Pilania , Benjamin Nachman

分类：机器学习 | 人工智能

2021-11-27

我们概述了新兴机会和挑战，以提高AI对科学发现的效用。AI为行业的独特目标与AI科学的目标创造了识别模式中的识别模式与来自数据的发现模式之间的紧张。如果我们解决了与域驱动的科学模型和数据驱动的AI学习机之间的“弥补差距”相关的根本挑战，那么我们预计这些AI模型可以改变假说发电，科学发现和科学过程本身。

translated by 谷歌翻译

Building an AI-ready RSE Workforce

Ying Zhang , Matthew A. Gitzendanner , Dan S. Maxwell , Justin W. Richardson , Kaleb E. Smith , Eric A. Stubbs , Brian J. Stucky , Jingchao Zhang , Erik Deumens

分类：人工智能

2021-11-09

人工智能一直在全球转变产业和学术研究，研究软件开发也不例外。在研究软件开发生命周期的各个方面都应用了机器学习和深度学习，从新算法设计范例到软件开发过程。在本文中，我们讨论了我们对当今挑战和机会的看法，即AI在研究软件开发和工程师中展示了我们在佛罗里达大学的方法，正在为AI的新时代做好准备我们的劳动力。

translated by 谷歌翻译